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sowie fehlerbehafteten Systemen. Hierfur wird vorgeschlagen, 



(57) Abstract: The invention relates to a method 
and an arrangement for randomly storing data in 
storage networks and/or an intranet and/or the internet, 
a corresponding computer program product, and a 
corresponding computer-readable storage medium, 
which are particularly suitable for distributing and 
retrieving data in error-tolerant and faulty systems such 
as storage networks or the internet. According to the 
inventive method for randomly storing data in storage 
networks and/or an intranet and/or the internet, one or 
several intervals, the total length of which corresponds 
to the relative capacity of the system, is/are assigned 
to each storage system. Said intervals are represented 
in a [0,1) interval but can overlap with other intervals 
as opposed to existing strategies. A real point is then 
assigned to each data block within the [0,1) interval 
by means of a (pseudo)random function. Optionally, 
said point can be part of several intervals of storage 
systems. A uniform placement strategy is used in order 
to assign the data block to one of said storage systems 
if that is the case. The interval lengths are adjusted 
correspondingly if the relative capacities of the storage 
systems change. 

(57) Zusammenfassung: Die vorlicgcndc Erfindung 
beschrcibt ein Vcrfahrcn und cine Anordnung zur ran- 
domisierten Datenspeicherung in Speichernetzwerken 
und/oder einem Intranet und/oder dem Internet sowie 
ein entsprechendes Computerprogramm-Erzeugnis und 
ein entsprechendes computerlesbares Speichermedium, 
wclchc insbesonderc cinsctzbar sind fur die Vertcilung 
und das Wicdcrauffindcn von Daten in fchlertolcrantcn 

[Fortsetzung auf der nachsten SeiteJ 
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dass bci dcm Vcrfahrcn zur randomisicrten Datcnspeichcrung in Spcichemctzwcrkcn und/oder cincm Intranet und/odcr dem Internet 
jedem Speichersystem ein oder mehrere Intervalle zugeordnet werden. Diese IntervaJle werden auf ein [0,l)-IntervaJl abgebildet, 
konnen sich aber im Gegensatz zu friiheren Stralegien mit anderen Intervallen iiberlappen. Jedem Datenblock wird nun mittels 
einer (pseudo- )zufal]igen Funktion ein reeller Punkt im [0,l)-lntervall zugewiesen. Dieser Punkt kann zu mehreren Intervallen 
von Speichersystemen gehOren. Falls dem so ist, wird eine uniforme Platzierungsstrategie verwendet, urn den Datenblock einem 
dicscr Spcichersystcmc zuzuweiscn. Verandcm sich die rclativcn Kapazitatcn der Spcichcrsystcme, so werden die Intcrvalllangcn 
angepasst. 
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Verf ahren und Anordnung zur randomisierten 
Datenspeicherung 

10 _ 



15 



Beschreibung 



20 Die vorliegende Erfindung betrifft ein Verfahren und 
eine Anordnung zur randomisierten Datenspeicherung in 
Speichernetzwerken und/oder einem Intranet und/oder dem 
Internet sowie ein entsprechendes Computerprogramm- 
Erzeugnis und ein entsprechendes computerlesbares 

25 Speichermedium, welche insbesondere einsetzbar sind fttr 
die Verteilung und das Wiederauf f inden von Daten in 
f ehlertoleranten sowie f ehlerbehaf teten Systemen, wie 
beispielsweise Speichernetzwerke, einem Intranet oder 
dem Internet. 

30 

Die Organisation von mehreren Datenspeichersystemen als 
effizientes und flexibles Speicher system erf order t die 
Losung zahlreicher Aufgaben. Eine der wichtigsten ist 
es, eine geeignete Datenplatzierung, d. h. eine geeig- 
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nete Strategie zur Verteilung der Datenblocke uber das 
Speichersystem zu finden, die einen schnellen Zugriff 
auf die Daten und eine hohe Sicherheit gegen Daten- 
verlust erlaubt. Im Rahmen der Beschreibung wird im 
5 Folgenden zwischen einer Menge von auf die Datenblocke 
zugreifenden Einheiten, den Clients, und einer Menge 
von Einheiten, die Datenblocke ausliefert, den Servern, 
unterschieden. Die Begriffe Server und Datenspeicher- 
system werden dabei synonym verwendet. 

10 

Die im Folgenden betrachteten Verfahren und Systeme 
dienen zum Aufbau von verteilten Datenservern und 
Speichernetzwerken, sowie zum Aufbau von Web-Systemen 
zum Caching von Daten. Ein verteilter Datenserver, bzw. 

15 ein Speichernetzwerk, besteht im Allgemeinen aus einer 
Menge von Computersystemen, die uber ein Netzwerk mit 
einer Menge von Datenspeichersystemen, verbunden sind. 
Das Verbindungsnetzwerk zwischen den Computersystemen 
und den Datenspeichersystemen besteht aus einer Menge 

20 von Switches bzw. Routern, die eine Zustellung der 
Datenpakete zwischen koramunizierenden Einheiten 
sicherstellen (siehe Figur 1) . Weiterhin kann das 
System liber eine Menge von SAN-Appliances (SAN = 
Storage Area Network) verfiigen, die an das Netzwerk 

25 angekoppelt sein konnen und ein Koordination zwischen 
den einzelnen Computersystemen und den 

Datenspeichersystemen sicherstellen (siehe Figur 2) . 
Weiterhin konnen so genannte In-Band-Appliances 
zwischen die Computer systeme und die Daten- 

3 0 speichersysteme geschaltet werden (siehe Figur 3). In- 
Band-Appliances finden bei der so genannten In-Band- 
Virtualisierung Verwendung. Bei der In-Band- 
Virtualisierung befindet sich die Kontrollinstanz, die 
In-Band-Appliance, im Datenstrom zwischen Server und 
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Speicher. Die Steuerdaten wie auch die Nutzdaten laufen 
durch die Appliance, die den Servern als das 
Speichersystem selbst erscheint. Die Zuordnung von 
Speichersegmenten, auch als logische Volumes 
5 bezeichnet, zu jedem einzelnen Server geschieht hier. 
Ebenso passiert die Steuerung des Datenzugrif f s iiber 
diese Appliance. Demgegeniiber gibt es auch den Ansatz, 
die Virtual isierung Ober die so genannte Out-of-Band- 
Virtualisierung zu realisieren. In diesem Falle 

10 befindet sich die Appliance aufcerhalb des Datenpfades 
und kommuniziert iiber das Netzwerk (beispielsweise ein 
LAN) mit dem Host-Bus-Adapter (HBA) im Server, der 
einen speziellen Agenten benotigt. Die Appliance 
definiert die logischen Volumes, die ein Server 

15 benutzen darf. Die exakten Information en iiber die 
zugehorigen logischen und physischen Blocke speichert 
der Server anschlieSend auf seinem HBA. In-Band verfiigt 
iiber den Vorteil, sich unkompliziert ins Speichernetz 
integrieren und warten zu lassen. Da In-Band im 

20 Datenpfad operiert, lasst sich die Datensicherheit 
durch eine Storage-Firewall in der SAN-Appliance mit 
geringem Auf wand erhohen. Out-Band gestaltet sich auf 
Grund der Wechselwirkungen zwischen den zusatzlichen 
Agenten auf den Applikationsservern und der SAN- 

25 Appliance komplexer. Im Gegensatz zu In-Band belegt 
diese Methode im Switch nur wenige Ports, so dass vor 
allem bei groSen redundant ausgelegten SANs eine hohere 
Skalierbarkeit zur Verfiigung steht. Zudem behindert ein 
Ausfall der SAN-Appliance den Datenzugrif f nicht . Im 

30 Falle des Einsatzes von In-Band- Appliances werden alle 
Lese/ Schreib-Operationen der an die In-Band- Appliances 
angeschlossenen Computersysteme erst von einer der In- 
Band-Appliances entgegengenommen , bevor sie an die 
Speichersysteme weitergeleitet werden. Die 
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Funktionalitat zum Management und zur Verteilung der 
Daten kann dabei sowohl in die Computersysteme, in die 
Router, als auch in die In-Band-Appliances integriert 
werden. Es wird im weiteren Verlauf davon ausgegangen, 
5 dass die an ein Speichernetzwerk bzw. einen verteilten 
Dateiserver angeschlossenen Computersysteme iiber alle 
fur das Auffinden von Daten notwendigen Inf ormationen 
verf iigen . 

10 Ein Web-Cache ist eine Einheit in einem Netzwerk, die 
stellvertretend fur einen oder mehrere Web-Server 
Zugriffe von Web-Clients beantwortet. Urn diese 
Funktionalitat zur Verfugung zu stellen, verfugt der 
Web-Cache iiber ein Speichersystem, auf dem Teile der 

15 Inhalte der Web-Server gespeichert werden. Speichert 
der Web-Cache die von einem Client angefragten 
Information nicht, so wird die Anfrage an einen 
iibergeordneten Web-Cache, bzw. den ur sprung lichen Web- 
Server weitergeleitet und von diesem beantwortet. Web- 

2 0 Caches erfreuen sich aus verschiedenen Griinden einer 
weiten Verbreitung im Internet. Durch den Einsatz eines 
Web-Caches kann die Latenzzeit, die zwischen dem 
Stellen einer Anfrage von dem Web-Client bis zu der 
erfolgreichen Auslieferung der Inf ormationen .an den 

25 Web-Client vergeht, signifikant reduziert werden. Die- 
ses trifft besonders dann zu, wenn die Bandbreite zwi- 
schen dem Web-Cache und dem Web-Client grower als die 
Bandbreite zwischen dem Web-Server und dem Web-Client 
ist oder wenn die Belastung des Web-Servers so hoch 

30 ist, dass es bei der Auslieferung der Daten in dem Web- 
Server selbst zu Stauungen kommt. Weiterhin kann durch 
den Einsatz von Web-Caches der Datenverkehr im Internet 
reduziert werden, wodurch eine Steigerung der Lei- 
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stungsf ahigkeit des gesamten Systems Internet erzielt 
werden kann. 

Durch die Kooperation mehrerer Web-Caches, die an ver- 
5 schiedenen Orten des Internets platziert werden, kann 
die Leistungsf ahigkeit des Internets deutlich erhoht 
werden. Beispielsweise fur die kooperative Zusammen- 
arbeit mehrerer Web-Caches sind das NLANR (National 
Laboratory of Applied Network Research) Caching- System, 
10 dass aus einer Menge von Backbone-Caches in den USA 
besteht, oder das Akamai Caching- System, das Caching- 
Services fur Unternehmen auf der ganzen Welt bereit- 
stellt. 

15 Der Hauptunterschied in der Bereitstellung von Ver- 
fahren zum Wiederauf f inden von Daten in Speichernetz- 
werken bzw. verteilten Dateiservern und filr Web-Caches 
besteht darin, dass im Falle von Speichernetzwerken die 

angeschlossenen Computersysteme iiber alle Inf ormationen 

» 

20 bezuglich der Platzierungsstrategie verfugen, die zum 
Wiederauf f inden der von ihnen verwendeten Daten not- 
wendig sind. Dieses umfasst unter anderem die Anzahl 
und die Eigenschaf ten der angeschlossenen Server, 
respektive der Datenspeichersysteme. Im Falle von Web- 

25 Caches verfugt der Client hingegen nur iiber eine 
beschrankte Sicht des Gesamtsys terns , d. h. er kennt 
nicht alle an das System angeschlossene Web-Caches. 
Werden nicht alle Daten auf alien Web-Caches ge- 
speichert, kann dieses dazu fiihren, dass der Web-Client 

3 0 ein Datum nicht von einem Web-Cache, sondern nur direkt 
vom Web-Server anfordern kann, da er entweder keinen 
Web-Cache kennt, der die von ihm angefragten Inf orma- 
tionen speichert, oder weil er zwar den fiir ihn re- 




WO 2004/021214 



PCT/EP2003/008635 



10 



15 



20 



25 



levanten Web-Cache kennt, jedoch diesen Web-Cache nicht 
als fur dieses Datum zustandig identif izieren. kann. 

Urn eine hohe Effizient, Skalierbarkeit und Robustheit 
eines Datenspeichersys terns, bzw. eines Web-Caches 
sicherzustellen, sind eine Reihe von Anf orderungen zu 
erfiillen. Eine geeignete Datenverwaltungsstrategie 
sollte: 

1. jede anteilsmaSige Aufteilung der Datenbl6cke auf 
die Speichersysteme erfiillen konnen. Fiir identische 
Systeme wird in der Regel die gleichmcL£ige Ver- 
teilung der Datenblocke uber die Systeme gefordert. 

2. es ermoglichen, die Datenfragen gemaS der anteils- 
ma£igen Zuordnung der Datenblocke an die Daten- 
speichersys teme verteilen zu konnen. Fur den Fall 
unterschiedlicher Zugrif f shauf igkeiten auf Daten- 
blocke ist dieser Punkt nicht automatisch durch 
Punkt 1 sichergestellt . 

3. f ehlertolerant sein, d. h. Ausfalle von Datenspei- 
chersystemen ohne Datenverlust iiberstehen konnen. 
Die verlorenen Teile sollten in moglichst kurzer 
Zeit neu generiert werden ktfnnen. 

4. sicherstellen, dass bei einer Hinzufiigung oder 
Wegnahme von Datenspeichersys temen nur moglichst 
wenige Datenblocke replatziert werden miissen, urn 
die oberen Punkte wieder herzustellen. Dieses 
sollte moglichst ohne spiirbare Beeintrachtigung des 
laufenden Betriebs geschehen. 

5. eine kompakte Speicherung und effiziente Berechen- 
barkeit der Platzierung sicherstellen. 



Verfttgt der Client nur uber unvollst&ndige Informatio- 
nen uber die Verteilung der Daten ttber die Datenspei- 
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chersysteme, wie z. B. der Client von Web-Caches, so 
muss zusatzlich der folgende Punkt unterstiitzt werden: 

6. auch wenn der Client nur uber unvollstandige, bzw. 
5 falsche fnf ormationen liber den Aufbau des Speicher- 

systems verfugt, muss die Datenplatzierungsstrate- 
gie sicherstellen, dass eine hochst mogliche Anzahl 
von Zugriffen auf das Speichersystem erfolgreich 
ist, d. h. an einen die Inf ormationen speichernden 
10 Server gestellt werden. 

Es gibt im Wesentlichen zwei Standardstrategien fur die 
Speicherung von Daten in Fes tplattensys tern: 

15 1. die Verwendung einer Zeigerstruktur , die ahnlich 
der Verbindungsstruktur in Dateisystemen fur klas- 
sische Speichermedien (wie z. B. Festplatten und 
Disketten) arbeitet, oder 
2. die Verwendung eines virtuellen Adressraums, der 

20 ahnlich eines virtuellen Adressraums in Rechnern 

verwaltet wird. 

Wir werden uns im Folgenden auf den zweiten Punkt 
beschranken und annehmen, die Daten eines Festplatten- 
2S systems werden in Form eines virtuellen Adressraums 
gleichgroEer Datenblocke verwaltet. Das Problem besteht 
also darin, eine geeignete Abbildung des virtuellen 
Adressraums auf die Festplatten zu finden. 

30 Die einfachste Art der Abbildung ist das so genannte 
Disk-Striping [CPK95] , das in vielen Ansatzen in 
unterschiedlicher Granularitat verwendet wird [PGK88, 
TPBG93 , BBBM94, BHMM93 , HG92, BGMJ94, BGM95] . Diese 
Methode hat eine weite Verbreitung in 
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Festplattenf eldern (auch als RAID-Arrays [RAID = 
Redundant Array of Independent Disks] bezeichnet) 
erfahren, da viele der optionalen Platzierungsmethoden 
(genannt: RAID-Level) auf Disk-Striping aufbauen. Beim 
5 Disk-Striping werden die Datenbldcke des virtuellen 
Adressraums (oder Teilblocke dieser Datenblocke) zyk- 
lisch um die Festplatten gewickelt. Diese Strategie hat 
den Nachteil, dass sie sehr unflexibel bezUglich einer 
sich andernden Anzahl an Festplatten ist, Eine Ver- 
io Snderung um lediglich eine Festplatte kann eine fast 
vollstandige Neuverteilung der Datenblocke erfordern. 
Aus diesem Grund sind heutige Festplattenf elder nur 
schlecht skalierbar. Ublicherweise werden daher Fest- 
plattensysteme mit sehr vielen Festplatten in mehrere 
15 RAID-Arrays untergliedert . 

Die Verwendung von zufalligen Datenplatzierungen 
(mittels pseudo-zufalliger Funktionen) ist bereits von 
vielen Forschern als vielversprechende Alternativ- 
methode angesehen worden [AT97, B97, SMB98 , K97] . In 
dieser Technik werden den Datenblocken zuf&llig aus- 
gewahlte Festplatten zugewiesen. Zu den erst en, die 
zufallige Datenplatzierungsstrategien untersucht haben, 
zahlen Mehlhorn und Vishkin [MV83] . Insbesondere haben 
sie untersucht, inwiefern mehrere zuf&llig platzierte 
Kopien pro Datenblock helfen konnen, \im Anfragen 
gleichmaSig auf die Speichereinheiten zu verteilen. 
Weitere wichtige Resultate in dieser Richtung sind 
z. B. von Upfal and Wigderson [UW87] und Karp, Luby und 
Meyer auf der Heide [KLM92] erzielt worden. 

Birk [B97] hat ahnliche Datenabbildungs- und -zugriffs- 
strategien vorgeschlagen, aber er verwendet eine 
Pari tat skodierung der Datenblocke. 



25 
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Wei t ere Arbeiten sind unter anderem von Santos und 
Muntz im Rahmen des RIO Datenserver-Projekts (RIO = 
Remote I/O) durchgeftihrt worden [SMB98 , SM98] . Sie 
5 vergleichen die zufallige Platzierung mit traditionel- 
len Striping-Methoden und zeigen, dass selbst in 
Situationen, fiir die Disk-Striping entwickelt worden 
ist (regulare Zugrif f smuster) , die zufallige Platzie- 
rung gleichwertig oder besser ist [SM98b] . Ihre zufal-. 

10 lige Platzierung basiert auf einem zufalligen Muster 
fester Gro£e. Falls die Anzahl der Datenblocke diese 
Grofie iibersteigt, dann wenden sie das Muster wiederholt 
an, urn den gesamten Datenraum auf die Festplatten abzu- 
bilden. Das kann naturlich zu unangenehmen Korrelatio- 

15 nen zwischen den Datenbldcken fuhren und eine Abwei- 
chung von der Gleichverteilung der Datenblocke und An- 
frag en verursachen. 

Bisher gibt es jedoch nur wenige Ansatze, die in der 
20 Lage sind, die Anf orderungen an eine effiziente, 
pseudo-randomisierte Datenplatzierung zu erflillen. 
Besonders Schwierigkeiten ergeben sich . dann, wenn 
heterogene, das heiSt verschieden groSe Datenspeicher- 
sy st erne verwendet werden oder wenn Datenspeichersysteme 
25 dynamisch in ein System eingefugt oder aus dem System 
herausgenommen werden. 

Ein erster Ansatz, um Datenblocke dynamisch und ran- 
domisiert iiber Datenspeichersysteme zu verteilen, ist 
30 in [KLL+97] vorgestellt worden. Dort werden (pseudo- 
) zufallige Funktionen verwendet, um den Datenblocken 
und Datenspeichersystemen zufallige reelle Punkte im 
Intervall [0,1] zuzuweisen. Ein Datenblock wird immer 
von dem Datenspeichersystem gespeichert, dessen Punkt 
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am n&chsten am Punkt des Datenblocks im [0 , 1] -Interval 1 
liegt. Der Vorteil dieser Strategie liegt darin, dass 
sie einfach zu verwalten ist und sie nur die 
Replatzierung einer erwartungsgem&£ minimalen Anzahl an 
5 Blocken bei einer wechselnden Anzahl an Datenspeicher- 
systemen erfordert. Sie hat allerdings den Nachteil, 
dass relativ hohe Schwankungen um den Erwartungswert 
fur die Anzahl der auf einem Datenspeicher system zu 
speichernden Blocke und der zu replatzierenden Blocke 
10 auftreten konnen und dass sie nur fur homogene Daten- 
speicher syst erne effizient anwendbar ist. 

In [BBS99] wurde ein Verfahren vorgestellt, das auch 
auf (pseudo-) zuf alligen Funktionen aufbaut. Die Daten- 
15 blocke werden wie auch in [KLL+97] mittels einer sol- 
chen Funktion auf zufallige Punkte im [0 , 1] -Interval 1 
abgebildet. Aber die Zuordnung des [0 , 1] -Intervalls auf 
die Datenspeichersysteme geschieht mittels einer fest 
vorgegebenen Abbildung, die Assimilierungs funktion ge- 

2 0 nannt wird. Diese Funktion sorgt dafiir, dass jede Fest- 

platte den gleichen Anteil des [0 , 1] -Intervalls zuge- 
wiesen bekommt. Damit kann gewahrleistet werden, dass 
nicht nur die benutzten Datenblocke des virtuellen 
Adressraums sondern auch Anfragen an diese Blocke 
25 gleichmaSig iiber die Festplatten verteilt werden kon- 
nen. Ein Vorteil dieses Verfahrens im Vergleich zu 
[KLL+98] liegt darin, dass die Assimilierungsfunktion 
die Daten mit wesentlich geringeren Abweichungen von 
der Gleichverteilung iiber die Datenspeichersysteme ver- 

3 0 teilen kann. Wie die Strategie in [KLL+98] benotigt 

diese Strategie nur die Replatzierung einer erwartungs- 
gemafe minimalen Anzahl an Bl6cken bei einer wechselnden 
Anzahl an Datenspeichersystemen. Allerdings funktio- 
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niert sie wie die Strategie in [KLL+98] nur gut fur 
homogene Systeme. 

Da es h&ufig aus Kostengrlinden nicht effizient ist, 
5 dass ein Speichersystem rein aus identischen Daten- 
speichersystemen besteht, wurden in [BSS00] auch 
Strategien fur nichtuni forme Datenspeichersysteme ent- 
worfen. Diese basieren auf der in [BBS99] vorgestellten 
Strategie fur identische Datenspeichersysteme. Zunachst 

10 wird angenommen, alle Systeme haben die gleiche 
Speicherkapazitat . Auf alle die Intervallteile, die 
uber die Kapazitat einer Datenspeichersysteme hinaus- 
gehen, wird dann in einer zweiten Runde noch einmal die 
Strategie fur identische Festplatten angewandt, aller- 

15 dings diesmal nur auf die Datenspeichersysteme, die 
nach der ersten Platzierungsrunde noch freie Kapazita- 
ten besitzen. Die dabei nicht unterzubringenden Inter- 
vallteile werden in einer weiteren Runde noch einmal 
platziert, usw. , bis das komplette [0, 1] -Intervall 

20 untergebracht ist. Der Hauptnachteil dieses Verfahrens 
besteht darin, dass es Situationen gibt, in denen 
deutlich mehr an Daten umplatziert werden, als minimal 
notwendig . 

25 Die Aufgabe, die durch die Erfindung gelost werden 
soil, besteht darin, ein Verfahren und eine Anordnung 
zur randomisierten Datenspeicherung in Speichernetzwer- 
ken und/oder einem Intranet und/oder dem Internet sowie 
ein entsprechendes Computerprogramm-Erzeugnis und ein 

30 entsprechendes computer lesbares Speichermedium bereit- 
zustellen, durch welche die vorstehend genannten Nach- 
teile behoben werden und insbesondere eine effektive 
Behandlung von Speichernetzwerken, die heterogene 
Speichermedien umfassen, sowie eine dynamische 
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Skalierung von Speichernetzwerken durch Einftigen oder 
Herausnehmen von Speichermedien gewahrleistet wird. 

Diese Aufgabe wird erf indungsgemaS gelost durch die 
5 Merkmale irn kennzeichnenden Teil der AnsprQche 1, 15, 
23 und 24 im Zusainmenwirken mit den Merkmalen im Ober- 
begriff . Zweckmafcige Ausgestaltungen der Erfindung sind 
in den Unteranspriichen enthalten. 

10 Ein besonderer Vorteil der Erfindung liegt darin, dass 
durch das Verfahren zur random! sier ten Datenspeicherung 
in Speichernetzwerken und/oder einem Intranet und/oder 
dem Internet die Behandlung von Anderungen im Speicher- 
netzwerk ganz erheblich vereinfacht wird, indem eine 

15 Menge von Datenblocken Di (i=l, . .., m) einer Menge von 
Datenspeichersystemen Sj (j=l, n) gem&£ den 

folgenden Schritten zugeordnet und dort gespeichert 
wird: 

a) der Gesamtmenge der Datenspeichersysteme wird ein 
20 virtueller Speicherraum und jedem einzelnen Daten- 

speichersystem Sj (j=l, . .., n) durch einen ersten 
Zufallsprozefe mindestens ein Teilraum Ij des vir- 
tuellen Speicherraums zugeordnet, wobei das Ver- 
haltnis zwischen dem Teilraum Ij und dem gesamten 
25 virtuellen Speicherraum wenigstens naherungsweise 

dem Verhaltnis der auf das Datenspeicher system Sj 
bzw. auf die Gesamtmenge der Datenspeichersysteme 
bezogenen Werte eines vorgebbaren Parameters 
entspricht , 

30 b) jedem Datenblock Di (i=l, . m) wird durch einen 
zweiten Zuf allsprozefc ein (zufailiges) Element h(i) 
des virtuellen Speicherraums zugeordnet, 
c) fxir jeden Datenblock Di (i=l, m) wird minde- 

stens ein Teilraum I k ermittelt, in dem h(i) ent- 
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halten ist, und der Datenblock Di mindestens einem 
der durch diese(n) Teilraume (Teilraum) I k repr&- 
sentierten Datenspeicher system S k zugeordnet und 
dort gespeichert . 

5 

Eine Anordnung zur randomisierten Datenspeicherung in 
Speichernetzwerken und/oder einem Intranet und/oder dem 
Internet ist vorteilhaf terweise so eingerichtet, da£ 
sie mindestens einen Prozessor umfafet, der (die) derart 

10 eingerichtet ist (sind) , da£ ein Verfahren zur 
randomisierten Datenspeicherung in Speichernetzwerken 
und/oder einem Intranet und/oder dem Internet durch- 
fuhrbar ist, wobei die randomisierte Datenspeicherung 
die Verfahrensschritte gemaS einem der AnsprUche 1 bis 

15 14 umfalSt. 

Ein Computerprogrammprodukt zur randomisierten Daten- 
speicherung in Speichernetzwerken und/oder einem Intra- 
net und/oder dem Internet umfa£t ein computerlesbares 

20 Speichermedium, auf dem ein Programm gespeichert ist, 
das es einem Computer ermdglicht, nachdem es in den 
Speicher des Computers geladen worden ist, ein Ver- 
fahren zur randomisierten Datenspeicherung in Speicher- 
netzwerken und/oder einem Intranet und/oder dem Inter - 

25 net durchzuf iihren, wobei die randomisierte Datenspei- 
cherung die Verfahrensschritte gema£ einem der An- 
spruche 1 bis 14 umfafit. 

Um eine randomisierte Datenspeicherung in Speichernetz- 
3 0 werken und/oder einem Intranet und/oder dem Internet 
durchzufuhren, wird vorteilhaf terweise ein computerles- 
bares Speichermedium eingesetzt, auf dem ein Programm 
gespeichert ist, das es einem Computer ermoglicht , 
nachdem es in den Speicher des Computers geladen worden 
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ist, ein Verfahren zur randomisierten Datenspeicherung 
in Speichernetzwerken und/oder einem Intranet und/oder 
dem Internet durchzuf uhren , wobei die randomisierte 
Datenspeicherung die Verf ahrensschritte gemafe einem der 
5 Anspruche 1 bis 14 umfaEt. 

In einer bevorzugten Ausfuhrungsf orm des erfindungs- 
gem&feen Verfahrens ist vorgesehen, dass bei dem ersten 
und/oder zweiten Zufallsprozefc pseudo-zuf allige 
10 Funktionen angewendet werden. 

Als ein weiterer Vorteil erweist es sich, wenn Daten- 
speichersysteme Sj, deren Wert Cj des vorgebbaren Para- 
meters einen ebenfalls vorgebbaren zweiten Wert 5 iiber- 

neue virtuelle Datenspeichersysteme Sj. 



steigt, in 



%\ * 8 * 0 - in ein 



15 mit cj. = 5 und - falls Cj - 

weiteres virtuelles Datenspeicher system S k mit c k = Cj - 
^- * 8 zerlegt werden und diesen virtuellen Daten- 

speichersystemen durch den ersten Zuf allsprozeS jeweils 
mindestens ein Teilraum Ij» bzw. I k des virtuellen 
20 Speicherraums zugeordnet wird, wobei \a\ den ganzzah- 

ligen Anteil einer Zahl a e 3 beschreibt. 
Des weiteren ist es von Vorteil, wenn der virtuelle 
Speicherraum durch das Intervall [0,1) und die Teil- 
raume Ij durch mindestens ein in [0,1) enthaltenes 

25 Teilintervall reprasentiert werden und im ersten Zu- 
fallsprozeS durch die Anwendung einer ersten Hash- 
Funktion g(j) der linke Rand des Intervalls Ij ermit- 
telt und die Lange des Intervalls gemafi (g(j) + s * Cj) 
berechnet wird, mit: 

30 Cj: Wert des auf das Datenspeichersystem Sj bezogenen 
Parameters und 
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s: Stretch-Faktor, der so gewahlt ist, da£ s * Cj < 1 
erfttllt ist. 

Von Vorteil ist es dabei, wenn der Stretch-Faktor s 
derart gewahlt wird, dass das Intervall [0,1) vollstan- 
5 dig durch die Teilintervalle Ij ttberdeckt wird. 

Im zweiten Zuf allsprozeS wird vorteilhaf terweise durch 
die Anwendung einer zweiten Hash-Funktion h(i) jedem 
Datenblock D± (i=l, . m) eine Zahl h(i) e [0,1) 
zugeordnet . 

10 In einer bevorzugten Ausfiihrungsform des Verfahrens zur 
randomisierten Datenspeicherung ist vorgesehen, dass 
der vorgebbare Parameter die physikalische Kapazitat 
von Datenspeichersystemen oder die Anfragelast von 
Datenspeichersystemen beschreibt oder Abweichungen von 

15 der gewunschten Verteilung korrigieren. 

In dem Fall, dass das einem Datenblock Di zugeordnete 
Element h(i) in mehreren Teilraumen Ij enthalten ist, 
erweist es sich als vorteilhaf t, dass eine uniforme 
Platzierungsstrategie angewendet wird, urn den Daten- 

20 block Di einem der durch die Teilraume Ij reprasen- 
tierten Datenspeichersystem zuzuordnen. 

Daruber hinaus ist es von Vorteil, dass bei Anderungen 
mindestens eines der Werte C=(c lf c n ) des vorgeb- 

baren Parameters eine erneute Zuordnung der Datenblocke 
25 Di zu den Datenspeichersystemen Sj nach dem Verfahren 
zur randomisierten Datenspeicherung gema£ einem der An- 
sprilche 1 bis 9 unter Zugrundelegung der neuen Para- 
meterwerte C'=(ci* t c a J erfolgt. 

In bestimmten Fallen kann es nutzlich sein, bei nur 
3 0 geringen Anderungen von Werten des vorgebbaren Para- 
meters keine Neuverteilung der Datenblbcke vorzunehmen. 
Dies wird erreicht, indem bei Anderungen mindestens 
eines der Werte C=(c lf c n ) des vorgebbaren Para- 

meters eine erneute Zuordnung der Datenblocke Di zu den 
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Datenspeichersystemen Sj nach dem Verfahren zur rando- 
misierten Datenspeicherung gemaS einera der Anspriiche 1 
bis 9 unter Zugrundelegung der neuen Parameterwerte 
C'-icx', Cn') nur erfolgt, wenn ein neuen Para- 

5 meterwert c^ sich von dem entsprechenden aktuellen 
Parameterwert ci um einen vorgebbaren Wert \i unter- 
scheidet . 

Bei groSen Anderungen des vorgebbaren Parameters 
wiederum werden Anpassungen des Systems vorteilhaf ter- 

10 weise vorgenommen, indem bei Anderungen mindestens 
eines der Werte C=(c lf c n ) des vorgebbaren 

Parameters in einen neuen Parameterwert C'^icx*, . .., 
Cn') stufenweise eine ( erneute Zuordnung der Datenblocke 
Di zu den Datenspeichersystemen Sj nach dem Verfahren 

15 zur randomisierten Datenspeicherung gema£ einem der 
Anspriiche 1 bis 9 erfolgt, wobei in jeder Stufe k 
Zwischen-Parameterwerte C^Wc*!, . c* n ) mit \Ci - C*ij 
< jc± - c'ij (i = 1, n) zugrundegelegt werden. 

Dieses Vorgehen hat den grofien Vorteil, dass das System 

2 0 im Gegensatz zu einem direkten Update wesentlich 
schneller auf hohe Anf ragebelastungen oder eine neue, 
vom Administrator gew&hlte Kapazitatsverteilung C ' 
reagieren kann, da in jedem C 1 der ttbergangsprozess von 
C nach C abgebrochen werden kann. 

25 Dariiber hinaus ist es von Vorteil, dass zur 
Abspeicherung der Datenblocke in einem Speichermedium 
mindestens eine Tabelle bereitgestellt wird, in denen 
die Zuordnung zwischen virtueller Adresse und 
physikalischer Adresse auf dem Speichermedium abge- 

30 speichert ist. 

Ein weiterer Vorteil des erf indungsgemafcen Verfahrens 
zur randomisierten Datenspeicherung besteht darin, dass 
mehrere Datenblocke zu einem Extent zusammengef asst 
werden, denen in der Tabelle eine gemeinsame physika- 
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lische Adresse auf dem Speichermedium zugeordnet wird, 
wobei die Datenblocke eines Extents im logischen 
Adressraum miteinander verbunden sind, indem der erste 
Datenblock eines aus 2 X Datenblocken bestehenden 
5 Extents eine Adresse der Form x00...000 erhalt, wobei 
die unteren A Bits Null sind, der letzte Block dieses 
Extents die Adresse xll...lll erh£lt, wobei die unter- 
sten A Bits Eins sind, und die physikalische Position 
eines Datenblocks durch eine Addition des Tabellen- 
10 eintrags fur den zugehorigen Extent mit den letzten A 
Bits der logischen Adresse des Datenblocks gewonnen 
wird. Durch dieses Vorgehen wird die Anzahl von zu 
sichernden Tabelleneintragen reduziert. 

15 In einer bevorzugten Ausfiihrungsf orm der Erfindung ist 
vorgesehen, dass die Anordnung mindestens einem Daten- 
speichersystem und/oder mindestens einem Computer- 
system, das (die) lesend und/oder schreibend auf die 
Speichermedien zugreift (zugreifen) , und/oder minde- 

20 stens eine zwischen das (die) Computersystem(e) und das 
(die) Datenspeichersystem(e) geschaltete Kontroller- 
Einheit zur Steuerung des Verfahrens randomisierten 
Datenspeicherung umfasst. Die Datenspeichersysteme 
umfassen dabei vorteilhaf terweise Festplattenf elder 

25 und/oder als Web-Cashes ausgebildete Zwischenspeicher 
Weiterhin stellt es sich als vorteilhaf t heraus, wenn 
die Anordnung mindestens eine zwischen das (die) Com- 
putersystem(e) und das (die) Datenspeichersystem(e) ge- 
schaltete Kontroller-Einheit zur Steuerung des Ver- 

30 fahrens zur randomisierten Datenspeicherung umfasst. 
Dabei kann es sich als nutzlich erweisen, dass das Ver- 
fahren zur randomisierten Datenspeicherung als Hard- 
ware-RAID-Verfahren in der Kontroller-Einheit implemen- 
tiert ist. 
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In einer weiteren bevorzugten Ausfiihrungsf orm der Er- 
findung ist vorgesehen, dass die Anordnung mindestens 
ein dediziertes, uber Mittel zum Datenaustausch mit 
Speichermedien und Computersystemen der Anordnung ver- 
5 bundenes Computer system (SAN-Appliance) zur Koordina- 
tion der Datenspeicherung und/oder uber Mittel zum 
Datenaustausch mit Speichermedien und Computersystemen 
der Anordnung verbundene Rechenressourcen (In-Band- 
Appliances) zur Verteilung der Datenblocke umfasst. 
10 Ebenso stellt es einen Vorteil dar, dass die Anordnung 
heterogene Speichermedien umfasst. 

Die Erfindung soil nachstehend anhand von zumindest 
teilweise in den Figuren dargestellten Ausfuhrungs- 
15 beispielen naher erlautert werden. 



Es zeigen: 



Fig. 1 Aufbau eines Speichernetzwerkes, 
20 Fig. 2 Veranschaulichung der Out-of-Band Virtuali- 

sierung des Datenraums, 
Fig. 3 Veranschaulichung der In-Band Virtuali- 

sierung, 

Fig. 4 Aufteilung der virtuellen Adresse eines 
25 Datenblocks zur Bestimmung der zugehorigen 

Festplatte und des zugehorigen Metablocks . 



Wie aus dem Anf orderungsprof il an die Datenverwaltungs- 
strategie ersichtlich wird, ist die Losung der Aufga- 
30 bens t el lung im Allgemeinen davon abhangig, ob die an 
ein System angeschlossenen Clients 3 uber alle fur die 
Datenverteilung notwendigen Inf ormationen verfiigen. Im 
Folgenden wird das erf indungsgema£e Verfahren, welches 
nachfolgend als Share-Strategie bezeichnet wird, 
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vorgestellt, welches in der Lage ist, in beiden Fallen 
nahezu optimale Verteilungs- und Zugrif f seigenschaf ten 
zu garantieren. 

5 Nachfolgend werden kurz Voraussetzungen und Definitio- 
nen vorgestellt, die bei der Beschreibung des Ausfiih- 
rungsbeispiels benutzt werden. 

Die Anzahl der in einem System zu speichernden Daten- 
10 blocke wird mit m, die Anzahl der maximal verwendbaren 
Datenspeichersysteme mit N bezeichnet. N wird dabei 
durch die Datenplatzierungsstrategie vorgegeben und ist 
nicht von der aktuellen Anzahl und Gr6£e der Daten- 
speichersysteme abhSngig. Die Anzahl der in dem System 
15 tatsachlich verfiigbaren Datenspeichersysteme wird mit n 
bezeichnet. Fur den Fall, dass die Anzahl der von den 
Datenspeichersystemen speicherbaren Datenblocke kleiner 
als m ist, ist es erf orderlich, dass ein weiteres Spei- 
chersystem zur Verfiigung gestellt wird, in das aktuell 
20 nicht abbildbare Datenblocke ausgelagert werden konnen. 

Der Anteil der Datenbl5cke, die von einem Datenspei- 
chersystem i gespeichert werden k6nnen, wird als rela- 
tive Kapazi tat ci e [0,1] bezeichnet, wobei Zi q = 1. 

25 Die Gr6£e der individuellen Ci kann dabei von verschie- 
denen Faktoren abhangen, so z. B. von der Speicher- 
kapazitat, wenn es sich urn eine Festplatte handelt, 
oder von der Bandbreite der angeschlossenen Verbin- 
dungen bei einem Web-Cache. Zielsetzung einer Daten- 

3 0 platzierungsstrategie sollte es sein, dass auf jedem 
Datenspeichersystem i bei m zu platzierenden Daten- 
blocken ci * in Datenblocke gespeichert werden. Bei der 
Beschreibung der umzusetzenden Techniken wird nicht 
davon ausgegangen, dass sich die Anzahl der Datenspei- 
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chersysteme in dem System verandert. Diese Situation 
kann dadurch modelliert werden, dass die relative 
Kapazitat Ci eines Datenspeichersystems i, das sich zum 
Zeitpunkt t nicht in dem System befindet, zu diesem 
5 Zeitpunkt auf Null gesetzt wird. 

Die Aufgabe der Datenverteilungsstrategie kann nun in 
zwei Aufgabenpunkte untergliedert werden. In einem er- 
sten Schritt muss ein Datenblock mit seiner virtuellen 

10 Adresse einem Datenspeichersystem zugeordnet werden. 
Diese Zuordnung wird im Folgenden auch als globale 
Datenverteilung bezeichnet. In einem zweiten Schritt 
muss der Datenblock nicht nur einem Datenspeicher- 
system, sondern zus&tzlich auch einer Position auf 

15 diesem Datenspeichersystem zugeordnet werden. Diese Zu- 
ordnung wird im Folgenden auch als lokale Daten- 
verteilung bezeichnet. Die Erfindung beschaftigt sich 
mit dem Problem der globalen Datenverteilung. Im Rahmen 
der Beschreibung des erf indungsgemafeen Verfahrens wer- 

2 0 den kurz einfache lokale Datenverteilungsstrategien 
vorgestellt, die unsere neuen globalen Datenvertei- 
lungsstrategien erganzen. 

Eine Voraussetzung far den Einsatz der Share-Strategie 
25 ist es, dass sie als Subroutine eine Funktion verwenden 
kann, die das Problem der Datenverteilung far uniforme 
Datenspeichersysteme lost, d. h. far den Fall, dass ci 
= y far alle i. Mogliche Strategien fur den uniformen 

Fall sind in [KLL+97] und [BBS00] vorgestellt worden. 

30 

Die Share-Strategie wird nun im Detail beschrieben: In 
Share werden jedem Speichersystem ein oder mehrere 
Intervalle zugeordnet, deren Gesamtgrofee der relativen 
Kapazitat des Systems entspricht. Diese Intervalle 
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werden auf ein [0 , 1) -Intervall abgebildet, konnen sich 
aber im Gegensatz zu friiheren Strategien mit anderen 
Intervallen iiberlappen. Jedem Datenblock wird nun 
mittels einer (pseudo- )zufalligen Funktion ein reeller 
5 Punkt im [0 , 1) -Intervall zugewiesen. Dieser Punkt kann 
eventuell zu mehreren Intervallen von Speichersystemen 
gehoren. Falls dem so ist, wird eine uniforme 
Platzierungsstrategie verwendet, um den Datenblock 
einem dieser Speichersysteme zuzuweisen. Verandern sich 
10 nun die relativen Kapazitaten der Speichersysteme, so 
werden die Intervalllangen entsprechend angepasst. 

Im Folgenden werden wir zunachst eine detaillierte Be- 
schreibung der Share-Strategie geben und anschliefcend 
15 darlegen, warum sie anderen Strategien ttberlegen ist. 

Die von der Share-Strategie verwendete Strategie fur 
uniforme Datenspeichersysteme wird im Folgenden als 
Uniform(b,S) bezeichnet, wobei b die virtuelle Adresse 
20 des Datenblocks und S die Menge der Datenspeicher- 
systeme beschreibt. Die Riickgabe der Funktion liefert 
das Datenspeichersystem, auf das der Datenblock b 
platziert wird. 

25 Die Share-Strategie basiert auf zwei zusatzlichen Hash- 
Funktionen, die neben den moglicherweise fur die uni- 
forme Strategie verwendeten Hash-Funktionen bereitge- 
stellt werden mussen. Die Hash-Funktion h: 
{!,..., M) -» [0,1) verteilt die Datenblocke pseudo- 

30 zufailig liber das Intervall [0,1). Eine weitere Hash- 
Funktion g: {1,..., N} -» [0,1) ordnet den beteiligten 
Datenspeichersystemen einen Punkt in dem Intervall 
[0,1) zu. Weiterhin werden die Parameter s, 8 e [1/N,1] 
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verwendet, deren Bedeutung im weiteren Verlauf 
erl&utert wird. 

Es wird angenommen, dass n Datenspeichersysteme mit 

5 (ci,...,c n ) e [0,l) n gegeben sind. Es wird dann die 

folgende Strategie verwendet: Fur jedes Datenspeicher- 



system mit ci £ 8 werden 



neue virtuelle Datenspei- 



chersysteme i' mit ci< = 5 eingefiigt. Entspricht die 
Summe der relativen Kapazitaten der virtuellen Daten- 
10 speichersysteme nicht der urspriinglichen Kapazitat, 
wird ein zusatzliches virtuelles Datenspeichersystem j 

mit Cj = ci - — * 5 eingefiigt. Datenspeichersysteme, 
L<?J 

deren Demand kleiner als S sind, werden in ihrer 
urspriinglichen Form belassen und als einzelne, vir- 
15 tuelle Datenspeichersysteme angesehen. Durch die 
Transformation der Datenspeichersysteme werden maximal 
n' < n + 1/8 virtuelle Datenspeichersysteme erzeugt. 



Jedem virtuellen Datenspeichersystem i wird nun ein 
20 Intervall Ii der Lange s * ci zugeordnet, das von g(i) 
bis (g(i) + s * Ci) modi reicht. Der [0 , 1) -Bereich wird 
also als Ring angesehen, urn den die einzelnen Inter- 
valle gewickelt werden. Die Konstante s wird als 
Stretch-Faktor bezeichnet. Urn zu verhindern, dass ein 
25 einzelnes Intervall mehrfach urn den Ring gewickelt 
wird, sollte 5 < J/ gewahlt werden. Ein 5 > J/ ist 

moglich, erschwert jedoch die Umsetzxing des Verfahrens. 



Fttr jedes x e [0,1) sei C x = (i: x e Ji} die Menge der 
30 Intervalle, in denen x en thai ten ist. Die Anzahl der 
Elemente c x = |c x | in dieser Menge wird als Contention 
bezeichnet. Da die Anzahl der Endpunkte der Intervalle 
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der 



virtuellen 



Datenspeichersysteme 



maximal 



2n < 2(n + y^) betragt, wird das [0 , 1) -Intervall in 

maximal 2 (n + J/^) Rahmen Fj e [0,1) aufgeteilt, so 

dass fur jeden Rahmen Fj die Menge C x fttr jedes x e Fj 
5 identisch ist. Die Beschrankung der Anzahl der Rahmen 
ist wichtig, urn die Gr6fce der Datenstrukturen fur die 
Share-Strategie zu begrenzen. 

Die Berechnung des zu einem Datenblock zugehorigen 
10 Datenspeichersystems erfolgt nun durch den Aufruf: 
Uniform (b, Ch(b) ) • 

Ein wichtiger Vorteil der Erfindung besteht wie erwahnt 
darin, da£ sie die Behandlung von Anderungen im Spei- 
15 chernetzwerk 1 in &u£erst einfacher Weise gestattet. Je 
nach Anforderung kann es sich dabei als sinnvoll 
erweisen, auf sich andernde Umgebungen mit einer 
Adaption der Share-Strategie zu reagieren. 

20 Bisher wurde erlautert, wie die Platzierung von Daten- 
blocken in einem statischen System vorzunehmen ist. Es 
wird nun angenommen, dass sich die Verteilung der 
relativen Kapazitaten in dem System von C=(c lf c n ) 
auf C'^Cc! 1 , c n ! ) verandert. Wie oben erlautert, 

25 umfasst dieses auch den Fall, dass neue Datenspeicher- 
systeme in das System eintreten, bzw. Datenspeicher- 
systeme das System verlassen. Es sind nun verschiedene 
Varianten denkbar, urn einen Ubergang von C nach C 
vorzunehmen. 



Variante 1: Direct Update 

Die einfachste Methode besteht darin, direkt von C nach 
C iiberzugehen und die entsprechenden Umplatzierungen 
vorzunehmen. Das hat den Nachteil, dass selbst bei 
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kleinsten Veranderungen wegen der Verwendung pseudo- 
zufalliger Funktionen eventuell Umplatzierungen von 
mehreren Datenblocken vorgenommen werden mussen, und 
bei grofcen Veranderungen das System sich lange in einem 
5 Ubergangszustand befindet, was die Auf rechterhaltung 
des oben genannten vierten Punktes der Anf orderungen an 
Datenverwaltungsstrategien gefahrden kann. 

Variante 2: Lazy Update 
10 Im Folgenden wird eine Strategie vorgestellt, die dafur 
sorgt, dass bei sehr geringen Kapazitatsver&nderungen 
keine Daten umzuverteilen sind. 

Sei 0 < \i < 1 eine feste Konstante, die als Tr&gheit 
15 der Share-Strategie bezeichnet wird. Die Share- 
Strategie andert die relative Kapazitat eines 
Datenspeichersystems i nur dann von ci auf ci 1 , wenn 
ci 1 > (1 + |X)Ci oder ci' < (1 - Jl)Ci. Hierdurch kann die 
Suirane der relativen Kapazitat en liber alle 
20 Datenspeichersysteme von 1 abweichen, bleibt jedoch im 
Bereich von 1 ± \i, so dass bei kleinem \l die 
Eigenschaf ten der Share-Strategie nicht gef&hrdet sind. 

Variante 3 : Smooth Update 

25 Diese Variante ist sinnvoll far den Fall grofier Kapazi- 
tatsanderungen. Falls C und C grofie Kapazitats- 
abweichungen haben, werden zunachst Zwischenstuf en 
Ci, C 2f C 3/ ...,C t berechnet, so dass mit C=C 0 und C'=C t +i 
fur jedes i in {0,...^} Ci und C i+ i eng genug beisammen 

3 0 liegen, dass es dem System moglich ist, schnell von der 
einen zur anderen Kapazitatsverteilung und damit in 
einen stabilen Zustand uberzugehen. Dieser Prozess hat 
den grofien Vorteil, dass das System im Gegensatz zum 
Direct Update wesentlich schneller auf hohe 
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Anfragebelastungen oder eine neu vom Administrator 
gewahlte Kapazi tats verteilung C" ' reagieren kann, da in 
jedem Ci der tibergangsprozess von C nach C abgebrochen 
werden. kann. 

5 

Konkrete Umsetzungen der Verfahren werden in der 
weiteren Beschreibung erlautert. 

Wahl der Kapazitaten: 

10 

Die Wahl der Kapazi taten far Share muss sich nicht not- 
wendigerweise nach der physikalischen Kapazitat eines 
Speichersystems richten. Da Share beliebige Kapazi tats- 
verteilungen zulasst, konnen die Share-Kapazitaten auch 

15 dazu benutzt werden, urn eine bessere Balancierung der 
Anfragelast vorzunehmen, urn zum Beispiel Engpasse in 
den Verbindungen zu Speichersystemen oder in den 
Speichersystemen selbst zu beseitigen. Des Weiteren 
konnen sie benutzt werden, urn Abweichungen von der 

20 gewiinschten Verteilung (die wegen der Verwendung 
pseudo-zufalliger Hash-Funktionen nicht auszuschlie£en 
sind) auszugleichen. Die Share Strategie erlaubt also 
eine hohe Flexibility in der Verteilung der Daten und 
eine hohe Robustheit, und erfullt damit wichtige 

25 Anforderungen an ein Speichersystem. 

Nachfolgend werden noch einige spezielle Aspekte des 
erf indungsgemaEen Verfahrens erlautert: 

30 1. Abdeckung des [0 , 1) -Intervalls 

Damit sichergestellt werden kann, dass die Share- 
Strategie jedem Datenpunkt ein Datenspeichersystem zu- 
weisen kann, muss das [0 , 1) -Intervall vollstandig durch 
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die Intervalle der virtuellen Datenspeichersysteme ab- 
gedeckt werden. Dieses kann bereits durch die Hash- 
Funktion g sichergestellt sein, indem nach der Vertei- 
lung der Intervalle der Datenspeichersysteme die Ab- 
5 deckung tiberprttft wird und gegebenenfalls einzelne 
Intervalle verschoben werden. Bei einer zufalligen 
Platzierung der Intervalle durch eine pseudo-randomi- 
sierte Hash-Funktion h ist es jedoch ausreichend, einen 
Stretch-Faktor s = k * In n mit k > 3 zu verwenden, so 
10 dass mit hoher Wahrscheinlichkeit die Intervalle der 
Datenspeicher Systeme das [0 , 1) -Intervall abdecken. 
Hohe Wahrscheinlichkeit bedeutet hier, dass die 
Wahrscheinlichkeit, dass ein Bereich nicht abgedeckt 
wird, kleiner als J/ ist. Ergibt die Kontrolle der 

15 Verteilung der Intervalle, dass nicht jeder Punkt des 
[0,1) -Intervalls abgedeckt ist, so kann die Abdeckung 
durch eine Adaption des Stretch-Faktors erfolgen. 

2. Benotigter Speicherplatz und Rechenkomplexitat 

20 

Wird die in [KLL+97] vorgestellte Strategie als 
homogene Datenplatzierungsstrategie Uniform (b, S) 
verwendet, so liegt die erwartete Zeit, das zu einem 
Datenblock zugehorige Datenspeicher system zu berechnen, 
25 in 0(1). Die Speicherkomplexitat zur Berechnung der 
Share-Strategie liegt in 0(s * k * (n + Nicht 

mitgez&hlt sind hier die Speicher- und Berechnungs- 
komplexit&t der verwendeten Hash-Funktionen. 

30 3. Giite der Verteil\ing 

Werden pseudo-randomisierte Hash-Funktionen verwendet 
und wird ein Stretch-Faktor s > 6 In (N/a 2 ) mit 
a = e/{l + £) gewahlt, so bewegt sich der Anteil der 
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Datenbldcke, die von einem Datenspeichersys terns i 
gespeichert werden, mit hoher Wahrscheinlichkeit in dem 
Bereich Si e [(1 - £)d i# (1 - £)&i] . 

5 In den folgenden Abschnitten wird dargestellt, wie der 
Aufbau von Datenspeichersystemen mit Hilfe der Share- 
Strategie effizient durchgefuhrt werden kann. Es wird 
darauf hingewiesen, dass es sich dabei lediglich um 
Implementierungsbeispiele handelt. In einem ersten 
10 Schritt wird vorgestellt, wie die Funktionalitat in ein 
allgemeines RAID-System integriert werden kann: 

Integration der Share-Strategie in ein allgemeines 
RAID-System: 

15 

Die Share-Strategie kann verwendet werden, um in 
Systemen, die aus einer Menge von Speichermedien, aus 
mehreren Computer systemen und einer Kontroller-Einheit 
bestehen, Festplattenf elder aufzubauen. Dabei kann die 

20 Share-Strategie sowohl in dem angeschlossenen Computer- 
systemen als Software-RAID Verfahren integriert werden, 
als auch in der Kontroller-Einheit als Hardware-RAID 
Verfahren. Die Share-Strategie ist dabei fur die Zuord- 
nung der Datenblocke tiber die Festplatten zustandig, 

25 die Zuordnung des Datenblocks zu einer physikalischen 
Adresse auf der Festplatte wird von einer unter der 
Share-Strategie liegenden Strategie ubernommen. Eine 
M6glichkeit fur die Zuordnung der physikalischen Posi- 
tion besteht in der Bereitstellung von Tabellen, in 

30 denen eine Zuordnung zwischen virtueller Adresse und 
physikalischer Adresse auf der Festplatte abgespeichert 
wird. 
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Es ist dabei moglich, die Anzahl der zu sichernden 
Tabelleneintrage zu reduzieren, indem nicht jedern 
einzelnen Datenblock ein eigener Eintrag zugeordnet 
wird, sondern indem Blockmengen minimaler Grofce, im 
5 Folgenden auch als Extents bezeichnet, uber einen 
gemeinsamen Eintrag in der Tabelle verfiigen. Bei einem 
Extent handelt es sich um eine Menge von Blocken, die 
in dem logischen Adressraum miteinander verbunden sind. 
Ein Extent besteht aus 2 A Blocken. Der erste Block des 

10 Extents hat eine Adresse der Form xOO. . .000, wobei die 
unteren A Bits 7 durch die Ziffer Null reprasentiert 
sind. Der letzte Block des Extents hat die Adresse 
xll... Ill, wobei die untersten A Bits 7 durch die 
Ziffer Eins reprasentiert sind. Die physikalische 

15 Position eines Datenblocks wird durch eine Addition des 
Tabelleneintrags ftir den zugehdrigen Extent mit den 
unteren A Bits 7 der logischen Adresse des Datenblocks 
gewonnen. Hat jeder Tabelleneintrag die Form yOO . . .000, 
d. h. die unteren A Bits 7 werden Null gesetzt, kann 

20 die Addition durch eine einfache ODER-Verkniipf ung 
durchgefuhrt werden. Die oberen Bits 6 der virtuellen 
Adresse eines Datenblocks dienen also zur Berechnung 
des zugeordneten Speichermediums und der Bestimmung des 
Tabelleneintrages fur den Extent, die unteren Bits 7 

25 dienen als Offset innerhalb des Extents. Allen Daten- 
blocken, die tiber gemeinsame obere Bits 6 verfttgen, 
wird ein Tabelleneintrag zugeordnet. Dieser Tabel- 
leneintrag kann z. B. an der Stelle gespeichert werden, 
an der auch die Berechnung der Share-Strategie durch- 

30 gefxihrt wird. 

Integration der Share-Strategie in ein Speichernetzwerk 1: 
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Die Integration der globalen Datenverteilungsstrategien 
in ein Speichernetzwerk 1 geht von einer Struktur gem&fc 
Figur 1 aus . Das Gesamt system besteht aus einer Menge 
von Datei- oder Datenbankservern, im Folgenden als 
5 Computersysteme bezeichnet, die liber ein Speichernetz- 
werk 1 an Datenspeichersysteme 4 angeschlossen sind. 
Das Speichernetzwerk 1 umfa£t weiter eine Menge von 
Switches bzw. Routern 2, die die Zustellung der Daten- 
pakete zwischen kommunizierenden Einheiten sicherstel- 

10 len. Die Computersysteme sind in dem hier vorliegenden 
Kontext als Clients 3 zu betrachten, die von den Daten- 
speichersystemen 4 Blocke lesen, oder auf den Daten- 
speichersystemen 4 Datenblocke schreiben. Mit Hilfe der 
Share-Strategie kann jede beliebige Teilmenge M der an 

15 das Speichernetzwerk 1 angeschlossenen Speichersysteme 
4 wie ein einziger logischer Speicherpool verwaltet 
werden, der tiber einen linearen Adressraum verfugt. Die 
Menge der Speichersysteme 4 kann dabei in mehrere 
kleinere oder einen grofcen Speicherpool aufgeteilt 

20 werden, wobei keine der Speichersysteme 4 mehr als 
einem Speicherpool zugeordnet werden sollte. Es wird im 
Folgenden nur der Fall betrachtet, dass das System aus 
einem Speicherpool besteht. 

25 Aus einem Speicherpool konnen mehrere virtuelle Spei- 
chersysteme aufgebaut werden, wobei jedes dieser vir- 
tuellen Speichersysteme gemafc der Share-Strategie ver- 
waltet wird. Besteht ein Speicherpool aus einer 
Teilmenge M der Speichersysteme, so erfolgt der Aufruf 

30 der Share-Strategie fur die logischen Speichersysteme 
gemafc der gesamten Teilmenge M. Jedem virtuellen Spei- 
chersystem wird eine Speicher-Policy zugeordnet die 
Eigenschaf ten wie physikalische BlockgrdSe und Redun- 
danz umfasst. Diese Zuordnung kann separat fur jedes 
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virtuelle Speicher system oder einmal fur den gesamten 
Speicherpool erfolgen. Nachdem Daten auf eine virtuelle 
Festplatte geschrieben wurden, kann die Speicher-Policy 
im Allgemeinen nicht mehr verandert werden. 

Wird von einem Computersystem auf einen Extent zuge- 
griffen, der bisher von dem Computersystem noch nicht 
verwendet wurde und fur den kein Tabelleneintrag in 
diesem Computersystem vorliegt, muss ein neuer Tabel- 
leneintrag allokiert werden. Die Allokation kann auf 
zwei Arten erfolgen: 

1. Das Computersystem fragt bei einer zentralen In- 
stanz, die uber globales Wissen Ober alle Tabel- 
leneintrage verfiigt, nach einem Tabelleneintrag fur 
das Extent, 

2. Auf jedem Speichersystem 4 ist ein Bereich reser- 
viert, der eine Zuordnung zwischen virtueller 
Adresse un£ physikalischer Adresse vornimmt. Das 
Computersystem sucht zuerst nach der virtuellen 
Adresse des Extents. Falls diese Adresse noch nicht 
reserviert ist, sucht das Computersystem nach einer 
noch freien Adresse auf dem Speichersystem 4. 

Wird die Koordination nicht durch eine zentrale Instanz 
vorgenoramen, so muss diese Aufgabe nach Figur 1 von 
einem oder mehreren der angeschlossenen Computersysteme 
iibernommen werden. Weiterhin konnen jedoch auch ein 
oder mehrere dedizierte Gerate, die als SAN-Appliances 
5 bezeichnet werden, zur Koordination der Computer- 
systeme gem&£ Figur 2 an das Speichernetzwerk 1 ange- 
schlossen werden. Neben der Entlastung der Computer- 
systeme urn die Koordination kann durch den Einsatz von 
SAN-Appliances 5 sichergestellt werden, dass alle 



WO 2004/021214 



PCT/EP2003/008635 



31 



angeschlossenen Computersysteme die gleiche Sicht auf 
die Speichersysteme 4 haben, d. h. zum gleichen Zeit- 
punkt uber das Verlassen bzw. Hinzukommen von Speicher- 
systemen 4 inform! ert werden. 

5 

Die SAN-Appliance 5 bietet somit eine Reihe von 
Schnittstellen, uber die Inf ormationen zwischen dem 
SAN-Appliances 5 und den Client-Rechnern 3 ausgetauscht 
werden kdnnen. Diese umfassen: 

10 

- Anfrage der Grundkonf iguration von jedem Client 3, 

- Anfrage nach neuen Extents von jedem Client 3, 

- Information der Clients 3 ttber Veranderungen der 
Infrastruktur . 

15 

Das Share -Verfahr en kann auch in so genannte In-Band- 
Appliances integriert werden (siehe Figur 3) . Bei den 
In-Band-Appliances handelt es sich urn dedizierte 
Systeme, die eine Transformation der logischen Adresse 

20 eines Datenblocks, die sie von den angeschlossenen 
Computersystemen erhalten, in die physikalische Adresse 
vomehmen. Der Einsatz von In-Band-Appliances ist dann 
notwendig, wenn die Funktionalitat der Share-Strategie 
nicht in die Computersysteme direkt integriert werden 

25 kann, da keine Software-Version der Share-Strategie fur 
diese Computersysteme verfiigbar ist oder die Leistung 
der angeschlossenen Computersysteme nicht ausreichend 
grofi ist, urn die Transformation der logischen Adressen 
in die physikalischen Adressen durchzufiihren. 

30 

Eine In-Band-Appliance verhalt sich aus Sicht der Spei- 
chersysteme 4 wie ein angeschlossenes Computersystem, 
aus der Sicht der an die In-Band-Appliance 
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angeschlossenen Computersysteme wie ein physikalisches 
Speicher system. 

In dem Speichernetzwerk 1 konnen In-Band- Appliances mit 
5 Computersystemen, in denen die Share-Strategie ausge- 
fiihrt wird, gemischt werden. 

Aufbau von Internetsystemen mit Hilfe der Share- 
Strategie : 

10 

Die Problemstellung beim Aufbau von Systemen zur Aus- 
lieferung von Datenobjekten tiber das Internet 
unterscheidet sich von dem Aufbau von Speicher systemen 
in sofern, dass Clients 3 in dem Internet keine globale 

15 Sicht uber alle verfiigbaren Web-Server und Web-Caches 
in dem System haben. Soli ein Dat;um von einem Web-Cache 
gelesen werden, urn die teilnehmenden Web-Server zu 
entlasten, muss also sichergestellt werden, dass der 
Client 3 mindestens einen zu einem Datenobjekt 

20 geh6renden Web-Cache kennt und das zu lesende Daten- 
objekt auch dem richtigen Web-Cache zuordnen kann. 

Diese Aufgabenstellung kann im Allgemeinen nicht gelost 
werden, ohne dass von einem Datenobjekt mehrere Kopien 

25 angelegt werden, die ttber die Web-Caches gemafc einer 
vorgegebenen Platzierungsstrategie verteilt werden. 
Werden von einem System von jedem Datenobjekt k Kopien 
gespeichert, so fragt der Client 3 nacheinander oder 
gleichzeitig bei den k Web-Caches nach, von denen er 

3 0 glaubt, dass sie eine Kopie des Datenobjektes spei- 
chern. Halt einer der Web-Caches eine Kopie des Daten- 
objektes, so wird diese Kopie anschliefcend von dem 
Client 3 gelesen. 
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Die Anzahl der notwendigen Kopien, damit ein Client 3 
einem Datenobjekt mindestens einen Web-Cache zuordnet, 
der auch dieses Datenobjekt speichert, ist von der 
verwendeten Verteilungsstrategie und den relativen 
5 Kapazitaten C= (c 1; . .., c n ) der Web-Caches abhangig. 
Weiterhin ist sie von der Sicht V=(v lf v n ) des 

Clients 3 abhangig, das hei&t von den relativen Grofcen 
der Web-Caches, die der Client 3 zu kennen glaubt. Die 
Konsistenz k v der Sicht eines Clients 3 wird wie folgt 
10 definiert: 



Es kann gezeigt werden, dass bei Verwendung der Share - 
15 Strategie die Verwendung von ©(log N) Kopien ausrei- 
chend ist, urn mit einer Wahrscheinlichkeit von gr6£er 

als fl — I garantieren zu konnen, das mindestens fiir 



ein Datenobjekt der Web-Cache, der von der Share- 
Strategie berechnet wird, far C und V derselbe ist. 



Die Erfindung ist nicht beschrankt auf die hier darge- 
stellten Ausftihrungsbeispiele . Vielmehr ist es moglich, 
durch Kombination und Modifikation der genannten Mittel 
und Merkmale weitere Ausfuhrungsvarianten zu realisie- 
25 ren, ohne den Rahmen der Erfindung zu verlassen. 





20 
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Patentanspruche 



1. Verfahren zur randomisierten Datenspeicherung in 
5 Speichernetzwerken und/oder einem Intranet und/ 

oder dem Internet, 

dadurch gekennzeichnet , dafi 

eine Menge von Datenblocken D± (i=l, . m) einer 
Menge von Datenspeichersystemen Sj (j=l, . .., n) 
10 gema£ den folgenden Schritten zugeordnet und dort 

gespeichert wird: 

a) der Gesamtmenge der Datenspeichersysteme wird 
ein virtueller Speicherraum und jedem einzel- 
nen Datenspeichersystem Sj (j=l, n) durch 

15 einen ersten Zuf allsprozefe mindestens ein 

Teilraum Ij des virtuellen Speicherraums 
zugeordnet, wobei das Verhaltnis zwischen dem 
Teilraum Ij und dem gesamten virtuellen Spei- 
cherraum wenigstens naherungsweise dem Ver- 

20 haltnis der auf das Datenspeichersystem Sj 

bzw. auf die Gesamtmenge der Datenspeicher- 
systeme bezogenen Werte eines vorgebbaren 
Parameters entspricht, 

b) jedem Datenblock Di (i=l, . m) wird durch 
25 einen zweiten Zuf allsprozeS ein (zuf&lliges) 

Element h(i) des virtuellen Speicherraums 
zugeordnet, 

c) fur jeden Datenblock Di (i=l, .../ m) wird 
mindestens ein Teilraum I* ermittelt, in dem 

30 h(i) enthalten ist, und der Datenblock D A min- 

destens einem der durch diese(n) Teilr&ume 
(Teilraum) I k reprasentierten Datenspeicher- 
system Sk zugeordnet und dort gespeichert. 
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2. Verfahren nach Anspruch 1, 
dadurch gekennzeichnet , daS 

bei dem ersten und/oder zweiten Zuf allsprozeS 
pseudo-zufallige Funktionen angewendet werden. 

3. Verfahren nach einem der Anspruche 1 oder 2, 
dadurch gekennzeichnet, da£ 

Datenspeichersysteme Sj, deren Wert Cj des vorgeb- 
baren Parameters einen ebenfalls vorgebbaren 

-H neue virtuelle 

7|| 

Datenspeichersysteme Sj» mit Cj> =8 und - falls 
■^4 * 5 ^ 0 - in ein weiteres virtuelles 

Til 

zerlegt werden und diesen virtuellen Datenspei- 
15 chersystemen durch den ersten Zuf allsprozefc je- 

weils mindestens ein Teilraum Ij* bzw. I k des vir- 
tuellen Speicherraums zugeordnet wird, wobei [a J 

den ganzzahligen Anteil einer Zahl a e 3 be- 
schreibt . 

20 

4. Verfahren nach einem der vorangehenden Anspruche, 
dadurch gekennzeichnet, date 

der virtuelle Speicherraum durch das Intervall 
[0,1) und die Teilraume Ij durch mindestens ein in 
25 [0,1) enthaltenes Teilintervall reprasentiert 

werden . 



10 zweiten Wert 5 ubersteigt, in 



Cj - 

Datenspeichersystem S k mit c k = Cj - 



5. 



Verfahren nach einem der vorangehenden Anspruche, 
dadurch gekennzeichnet, da£ 



WO 2004/021214 



PCI7EP2003/008635 



41 

im ersten Zufallsprozefc durch die Anwendung einer 
ersten Hash-Funktion g(j) der linke Rand des 
Intervalls Ij ermittelt und die Lange des 
Intervalls gemaS (g(j) + s * cj) berechnet wird, 
mit : 

Cj: Wert des auf das Datenspeichersystem Sj 

bezogenen Parameters und 
s: Stretch-Faktor, der so gewahlt ist, da£ 

s * Cj < 1 erftillt ist. 

6. Verfahren nach einem der vorangehenden Anspriiche, 
dadurch gekennzeichnet , da£ 

der Stretch-Faktor s derart gewahlt wird, dass das 
Intervall [0,1) vollstandig durch die Teilinter- 
valle Ij uberdeckt wird. 

7. Verfahren nach einem der vorangehenden Anspriiche, 
dadurch gekennzeichnet, da£ 

im zweiten Zuf allsprozeS durch die Anwendung einer 
zweiten Hash-Funktion h(i) jedem Datenblock Di 
(i=l, . .., m) eine Zahl h(i) e [0,1) zugeordnet 
wird. 

8. Verfahren nach einem der vorangehenden Anspriiche, 
dadurch gekennzeichnet, da£ 

der vorgebbare Parameter 

- die physikalische Kapazitat von Datenspeicher- 
systemen oder 

die Anfragelast von Datenspeichersystemen be- 
schreibt oder 

Abweichungen von der gewiinschten Verteilung 
korrigieren . 
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Verfahren nach einem der vorangehenden Anspriiche, 
dadurch gekennzeichnet , da£ 

in dem Fall, dass das einem Datenblock Di zugeord- 
nete Element h(i) in mehreren Teilraumen Ij ent- 
halten ist, eine uniforme Platzierungsstrategie 
angewendet wird, urn den Datenblock Di einem der 
durch die Teilraume Ij reprasentierten Datenspei- 
chersystem zuzuordnen. 



10 



10. Verfahren nach einem der vorangehenden Anspriiche, 
dadurch gekennzeichnet, dafi 

bei Anderungen mindestens eines der Werte 
C-(c lf c n ) des vorgebbaren Parameters eine 

15 erneute Zuordnung der Datenbl6cke Di zu den 

Datenspeichersystemen Sj nach dem Verfahren zur 
randomisierten Datenspeicherung gemafi einem der 
Anspriiche 1 bis 9 unter Zugrundelegung der neuen 
Parameterwerte C / = (ci* / c n <) erfolgt. 

20 

11. Verfahren nach einem der vorangehenden Anspriiche, 
dadurch gekennzeichnet, da£ 

bei Anderungen mindestens eines der Werte 
C=(c lf c n ) des vorgebbaren Parameters eine 

25 erneute Zuordnung der Datenblocke Di zu den 

Datenspeichersystemen Sj nach dem Verfahren zur 
randomisierten Datenspeicherung gema£ einem der 
Anspriiche 1 bis 9 unter Zugrundelegung der neuen 
Parameterwerte C^fcx*, c n J nur erfolgt, wenn 

30 ein neuen Parameterwert Ci< sich von dem ent- 

sprechenden aktuellen Parameterwert ci urn eine 
vorgebbare Konstante |i unterscheidet . 
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12. Verfahren nach einem der vorangehenden Anspriiche, 
dadurch gekennzeichnet, da£ 

bei Anderungen mindestens eines der Werte 
5 C=(c lt c n ) des vorgebbaren Parameters in 

einen neuen Parameterwert C' = (ci', . c n >) stu- 
fenweise eine erneute Zuordnung der Datenbl5cke Di 
zu den Datenspeichersystemen Sj nach dem Verfahren 
zur randomisierten Datenspeicherung gemaS einem 
10 der Anspriiche 1 bis 9 erfolgt, wobei in jeder 

Stufe k Zwischen-Parameterwerte d^-ic^x, c^ n ) 
mit \c± - cPij < jci - c'ij (i = 1, . . . , n) zugrun- 
degelegt werden. 

15 13. Verfahren nach einem der vorangehenden Anspriiche, 
dadurch gekennzeichnet, da£ 

zur Abspeicherung der Datenblocke in einem Spei- 
chermedium mindestens eine Tabelle bereitgestellt 
wird, in denen die Zuordnung zwischen virtueller 
20 Adresse und physikalischer Adresse auf dem Spei- 

chermedium abgespeichert ist . 

14 . Verfahren nach Anspruch 13 , 
dadurch gekennzeichnet, dafi 

25 mehrere Datenblocke zu einem Extent zusammen- 

gefasst werden, denen in der Tabelle eine gemein- 
same physikalische Adresse auf dem Speichermedium 
zugeordnet wird, wobei die Datenblocke eines 
Extents im logischen Adressraum miteinander ver- 

3 0 bunden sind, indem der erste Datenblock eines aus 

2 X Datenbl6cken bestehenden Extents eine Adresse 
der Form xOO.,.000 erhalt, wobei die unteren A 
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10 



15 



20 



25 



Bits durch die Ziffer Null repr&sentiert sind, der 
letzte Block dieses Extents die Adresse xll...lll 
erhalt, wobei die untersten A Bits durch die Zif- 
fer Eins reprasentiert sind, und die physikalische 
Position eines Datenblocks durch eine Addition des 
Tabelleneintrags fur den zugehorigen Extent mit 
den letzten A Bits der logischen Adresse des 
Datenblocks gewonnen wird. 

15. Anordnung mit mindestens einen Prozessor, der 
(die) derart eingerichtet ist (sind) , daS ein Ver- 
fahren zur randomisierten Datenspeicherung in 
Speichernetzwerken und/oder einem Intranet und/ 
oder dem Internet durchfiihrbar ist, wobei die 
randomisierte Datenspeicherung die Verfahrens- 
schritte gema£ einem der Anspruche 1 bis 14 
umfasst . 

16. Anordnung nach Anspruch 15, 
dadurch gekennzeichnet , da£ 

die Anordnung 

mindestens einem Datenspeichersystem und/oder 
mindestens einem Computersystem, das (die) 
lesend und/oder schreibend auf die Speicher- 
medien zugreift (zugreifen) , und/oder 
mindestens eine zwischen das (die) Computersy- 
stem (e) und das (die) Datenspeichersystem (e) 
geschaltete Kontroller-Einheit zur Steuerung 
des Verfahrens randomisierten Datenspeicherung 

umfasst. 



Anordnung nach Anspruch 16, 
dadurch gekennzeichnet, da£ 
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10 



15 



20 



25 



das Datenspeichersystem 

Festplattenfelder und/oder 

als Web-Cashes ausgebildete Zwischenspeicher 
umfasst. 

18. Anordnung nach einem der Anspriiche 15 bis 17, 
dadurch gekennzeichnet, da£ 

die Anordnung mindestens eine zwischen das (die) 
Computersystem(e) und das (die) Datenspeicher- 
system (e) geschaltete Kontroller-Einheit zur 
Steuerung des Verfahrens zur randomisierten Daten- 
speicherung umfasst. 

19. Anordnung nach Anspruch 18, 
dadurch gekennzeichnet , da£ 

die Anordnung mindestens ein uber die Kontroller- 
Einheit auf die Speichennedien zugreifendes 
Computersystem umfasst. 

20. Anordnung nach einem der Anspriiche 15 bis 19, 
dadurch gekennzeichnet, da£ 

das Verfahren zur randomisierten Datenspeicherung 
als Hardware -RAID- Verfahren in der Kontroller-Ein- 
heit implementiert ist. 

21. Anordnung nach einem der Anspriiche 15 bis 20, 
dadurch gekennzeichnet, date 

die Anordnung 



mindestens ein dediziertes, uber Mittel zum 
Datenaustausch mit Speichermedien und Computer- 
systemen der Anordnung verbundenes Computer- 
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system (SAN-Appliance) zur Koordination der 
Datenspeicherung und/oder 

iiber Mittel zum Datenaustausch mit Speicher- 
medien und Computersystemen der Anordnung ver- 
bundene Rechenressourcen (In-Band-Appliances ) 
zur Verteilung der Datenblocke 
umfasst . 

22. Anordnung nach einem der Anspriiche 15 bis 21, 
dadurch gekennzeichnet, da£ 

die Anordnung heterogene Speichermedien umfasst. 

23. Computerprogrammprodukt, das ein computerlesbares 
Speichermedium umfa£t, auf dem ein Programm ge- 
speichert ist, das es einem Computer ermoglicht, 
nachdem es in den Speicher des Computers geladen 
worden ist, ein Verfahren zur randomisierten 
Datenspeicherung in Speichernetzwerken und/oder 
einem Intranet und/oder dem Internet durchzu- 
fiihren, wobei die randomisierte Datenspeicherung 
die Verfahrensschritte gem&£ einem der Anspriiche 1 
bis 14 umfafit. 

24. Computerlesbares Speichermedium, auf dem ein Pro- 
gramm gespeichert ist, das es einem Computer er- 
moglicht, nachdem es in den Speicher des Computers 
geladen worden ist, ein Verfahren zur randomi- 
sierten Datenspeicherung in Speichernetzwerken 
und/oder einem Intranet und/oder dem Internet 
durchzufiihren, wobei die randomisierte Datenspei- 
cherung die Verfahrensschritte gemafe einem der 
Anspruche 1 bis 14 umfafet. 
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International Anmeldedatums, eln 
Patent zu beantragen und zu erhaiten 
(Regeln 4.17 Ziffer il und 51bis.1 
Absatz a Ziffer li), fur den Fall, dafl elne 

FrklSri inn narh Panol 4 17 7[ffnr iv 

nlcht einschlagig 1st: 
Name: 


in bezug auf diese Internationale 
Anmeldung 

Brinkmann, Andre 

ist kraft des nachfolgend Aufgefuhrten 
berechtigt, ein Patent zu beantragen und 
zu erhaiten: 
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Brinkmann, Andre , wohnhaft in Biitervenn 
23c Schloss Holte Deutschland, ist der 
Erfinder des Gegenstandes, fur den im 
Wege diese international en Anmeldung urn 
Schutz nachgesucht wird 
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Diese Erklarung wird abgegeben Im 
Hinblick auf: 


alle Bestimmungsstaaten (mit Ausnahme 
der Vereinigten Staaten von Amerika) 



